STATISTIQUE
Cours

3. Intervalle de confiance d'une moyenne

Les méthodes de calculs restent les mêmes que pour les intervalles de fluctuation. Les fluctuations d'échantillonnage font que la valeur observée (m) pour la moyenne d'un caractère quantitatif dans un échantillon ne peut être qu'une approximation de la moyenne µ , inconnue, dans la population. Nous allons donc définir un intervalle qui a une certaine probabilité de contenir la vraie valeur µ de la population. Le plan d'échantillonnage revêt ici une importance encore plus grande que dans les problèmes d'échantillonnage car le travail se fait en aveugle (on ne connait pas la population de départ). Il faut donc mettre toutes les chances de son coté pour obtenir un échantillon le plus représentatif possible de la population. Une fois ceci réalisé, le calcul de l'intervalle de confiance n'est plus qu'une opération technique qui nécessite cependant de prendre en compte quelques conditions préalables. Ces conditions de validité justifieront l'utilisation de telle ou telle loi théorique de distribution d'échantillonnage.

La loi de distribution des moyennes des échantillons que l'on peut utiliser de façon générale est la loi de Student. Elle prend en compte l'estimation de la variance de la population (s2). On rappelle que cette estimation se calcule de la façon suivante : où n-1 représente le nombre de degrés de liberté.

L'utilisation de cette loi nécessite que l'on ait vérifié la normalité de la distribution du caractère aléatoire quantitatif dans la population. Étant donné que l'on travaille sur une population inconnue, on peut au mieux faire l'hypothèse de normalité (ou estimer cette normalité par une étude portant sur un échantillon).

La formule utilisée pour calculer l'intervalle de confiance au risque α s'écrit alors : où m et s sont les estimations de µ et σ , tα la variable de Student donnée avec un risque α pour n-1 ddl et n la taille de l'échantillon.

Pratiquement, on utilisera cette loi dans le cas des petits échantillons (n<30).

En effet, pour les grand échantillons (n>30) on préférera utiliser une approximation de la loi de Student, la loi Normale, avec laquelle il n'est pas nécessaire de supposer la normalité de la distribution du caractère aléatoire dans la population.

L'intervalle de confiance est alors donné par :

où εα est la variable centrée réduite de la loi Normale pour un risque α.

Précision d'un sondage

Pour un risque donné, on constate que l'incertitude absolue i du sondage (i= pour les petits échantillons et i= pour les grands échantillons) dépend d'une part de l'écart type estimé s et de la taille de l'échantillon n (qui intervient également dans l'estimation s). La précision d'un sondage est donc d'autant plus grande que l'échantillon est grand. Pour obtenir une précision 10 fois meilleure, il faut donc multiplier au moins par 100 la taille de l'échantillon. La précision dépend aussi de la variabilité du caractère étudié et sera donc accrue lorsque le caractère est moins variable.

En se fixant une précision et un risque donnés, on peut, en première approximation, estimer le nombre d'individus nécessaire pour réaliser le sondage. Pour i= , on aura . Ce calcul reste une approximation car la valeur de s doit être connue à partir d'un échantillon extrait préalablement et cette valeur dépend elle-même de la taille de l'échantillon.

AccueilImprimerRéalisé avec SCENARI2. Intervalle de fluctuation ( de pari) d'un pourcentage (page Précédente)4. Intervalle de confiance d'un pourcentage (page suivante)